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基于 均衡 数据 放置 策略 的 分 布 式 网 络 存储 编码 缓存 方案 


陈 二 胡 玉 平 ? 
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摘 要 : 为 了 保证 网 络 存储 的 负载 平衡 并 避免 在 节点 或 磁盘 故障 的 ee 提出 一 种 基于 均衡 


数据 放置 策略 的 分 布 式 网 络 存储 编码 缓存 方案 ， 针 对 大 型 高 速 缓存 和 小 型 缓存 分 


给 出 了 不 同 的 解决 办 法 。 0 


将 Maddah 方案 扩展 到 多 服务 器 系统 ， 结 合 均 衡 数据 放置 策略 ， a 中 ; 

而 解决 大 型 高 速 缓存 问题 ; 然后 ， 将 干扰 消除 方案 扩展 到 多 服务 器 系统 ， 利 用 干扰 消除 。W 
结合 均衡 数据 放置 策略 ， 提出 缓存 分 段 的 线性 组 合 ， 从 而 解决 小 型 缓存 问题 。 最 后 ， 通 过 基于 
件 ， 分 别 在 一 个 和 两 个 奇偶 校 验 服 务 器 系统 中 进行 仿真 实验 ， 仿 真 结果 表明 ， 提 出 的 方案 可 以 有 效 地 降低 峰值 传输 


速率 ， 相 比 其 他 两 种 较 新 的 缓存 方案 ， 提 出 的 方案 
同 服务 器 的 内 容 组 合成 单个 消息 的 能 力 ， 导 致 编码 缓存 方案 性 能 损失 ， 


有 郊 余 ， 从 而 提高 存储 系统 的 性 能 。 


关键 词 : 均衡 数据 放置 策略 ; 分 布 式 网 络 存储 ; 


Linux 的 NS2 仿真 软 


获得 了 更 好 的 性 能 。 此 外 ， 采 用 分 布 式 存储 虽然 限制 了 将 来 自 不 
但 可 以 充分 利用 分 布 式 存储 系统 中 存在 的 固 
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Distributed network storage and coding scheme based on balanced data placement strategy 


Chen Xue!, Hu Yuping” 
(1. Dept. of Computer Science & Engineering, Guangzhou College of Technology & Business, Guangzhou 510850, China; 


2. School of Information Science, Guangdong University of Finance & Economics, Guangzhou 510320, China) 


Abstract: In order to ensure the load balance of network storage and to avoid unrecoverable loss in case of node or disk 


failures, this paper proposed a distributed storage and coding scheme based on balanced data placement strategy, which gave 


ED | different solutions for large caches and small caches. Firstly, the Maddah scheme is extended to multi-server system, and 


OO) each file is stored as a unit in the data server by combining balanced data placement strategy to solve the large-scale cache 
problem. Then, the interference cancellation scheme is extended to the multi-server system. The interference cancellation 


Scheme is used to reduce the peak rate of the cache, and the linear combination of cache segments is proposed by combining 


i balanced data placement strategy so as to solving the problem of small caching. Finally, simulation experiments are carried 


out in one and two parity check server systems respectively through Linux-based NS2 simulation software. The simulation 
results show that the proposed scheme can effectively reduce the peak transmission rate. It has achieved better performance 
comparing with the other two new caching schemes. In addition, although distributed storage limits the ability to combine 


content from different servers into a single message, resulting in performance loss of coding and caching schemes, it can 


make full use of the inherent redundancy in distributed storage systems, thereby improving the performance of storage 


systems. 
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0 引言 


有 本 地 存储 器 的 用 户 如 何 通 过 


independent disks,RAID)02 在 编码 缓存 方面 的 应 


j 越 来 越 ) 最 差 情况 下 的 性 


泛 ，RAID 是 一 种 基于 纠 删 码 的 分 布 式 存储 技术 ， 


它 将 多 个 ” 的 方案 来 考虑 非 统一 的 文件 大 小 。 


存储 节点 (磁盘 、 服 务 器 等 ) 组 合成 一 个 具有 数据 元 余 的 逻辑 。 段 进 行 编码 设计 了 一 种 新 的 算法 ， 


和 两 个 专用 奇偶 校 验 节点 组 成 的 块 级 条 带 组 成 B41 


。 大 多 数 大  ” 重 于 单个 服务 器 系统 。 


个 共同 的 服务 器 从 一 台 服 务 
器 有 效 地 接收 数据 链接 ， 它 提出 了 一 个 缓存 和 交付 方案 ， 在 
近年 来 ， 独 立 磁盘 见 余 阵列 (redundant array of ”信息 理论 最 优 的 常数 因子 以 及 该 最 优 值 的 上 限 和 下 限 内 提供 
引 。 文 献 [7] 对 下 界 进行 了 细 化 ， 并 设计 了 新 


文献 [89] 对 高 速 缓存 和 传输 
以 获得 比 当 缓存 容量 较 小 


单元 。 其 中 两 个 最 常见 的 是 RAID-4 和 RAID-6, 分 别 由 一 个 或 用 户 数 量 大 于 文件 数量 时 更 好 的 性 能 。 但 是 ， 这 个 方案 着 


型 系统 使 用 某 种 形式 的 RAID， 将 多 个 存储 驱动 器 条 带 化 ， 在 分 布 式 存储 方面 ， 研 究 人 员 研究 了 单个 用 户 如 何 能 够 


但 将 整个 文件 作为 一 个 单元 存储 或 复制 到 网 络 节点 外 。 这 样 ” 有 效 地 恢复 分 布 在 一 组 节点 上 的 数据 ， 研究 了 具有 本 地 
可 以 提高 峰值 速度 ， 同 时 也 简化 了 记录 和 重复 数据 删除 ， 提 存储 器 的 一 组 用 户 如 何 有 效 地 从 自 


个 节点 接收 数据 。 为 了 


保 
六 点 或 磁盘 故障 的 情况 下 造 


高 了 安全 性 ， 并 使 网 络 更 加 灵活 。 文 献 [6] 的 研究 关注 一 组 证 网 络 存储 的 负载 平衡 并 避免 在 节 
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成 不 可 恢复 的 损失 ， 提 出 一 种 基于 均衡 数据 放置 策略 的 分 布 
式 网 络 存储 编码 缓存 方案 ， 针 对 大 型 高 速 缓存 和 小 型 缓存 分 
别 给 出 了 不 同 的 解决 办 法 。 提 出 的 方案 旨 在 为 多 服务 器 多 用 
户 系统 设计 一 个 联合 存储 和 传输 协议 ， 将 分 布 式 存储 与 利用 
并 行 性 和 元 余 性 的 编码 缓存 相 结合 ， 以 降低 峰值 流量 速率 。 


1 ”研究 背景 


1.1 系统 模型 

本 文 考虑 一 个 天 个 用 户 和 个 文件 存储 在 工 个 数据 服 
务 器 中 的 网 络 。 当 存储 数据 使 用 不 同 的 线性 组 合 时 ， 本 文 还 
使 用 了 额外 的 奇偶 校 验 服 务 器 ， 每 个 服务 器 存储 相同 数量 、 
大 小 的 文件 ,每 个 用 户 都 有 一 个 容量 为 M 个 文件 的 缓存 ， 并 
旦 本 文 假设 所 有 文件 具有 相同 的 长 度 和 流行 度 。 
段 设 服 务 器 在 独立 的 无 错 通 道上 运行 ， 以 便 两 台 或 两 台 
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时 ， 性 能 较 差 。 因 此 ， 文 献 [7] 中 提出 了 一 种 新 的 基于 干扰 消 
除 的 编码 缓存 方案 。 它 不 是 以 简单 的 形式 缓存 文件 段 ， 而 是 
建议 用 户 缓存 多 个 段 的 线性 组 合 。 所 发 送 的 消息 被 设计 为 使 
用 最 大 距离 可 分 码 (MDS) 来 实现 00。 


在 存储 阶段 ， 这 个 方案 也 将 每 个 文件 分 解 为 ”个 非 


佬 的 大 小 相同 的 段 。 设置 思 存储 ,其 中 Sc{12…,K} 和 |SEFt 
表示 文件 五 中 的 文件 段 被 5 中 的 用 户 缓存 。 在 放置 阶段 ， 用 
户 上 收集 文件 段 : 


TEN 


{Fs lie{h2..,N),kes)} (3) 


令 P-(?IJw ， 使 用 个 长 度 为 


1 一 1 


8 人 人]w-( jw- 的 MDps 编码 C(n.P) ， 且 在 其 缓存 


以 上 的 服务 器 可 以 同时 传输 消息 ， 而 不 会 对 相同 或 不 同 的 用 
户 产 生 干 扰 四 。 服 务 器 可 以 将 相同 的 消息 广播 给 多 个 用 户 
而 无 须 额 外 的 带宽 成 本 ， 但 是 用 户 不 能 共享 其 高 速 缓存 的 内 
容 。 同 样 ， 每 台 服 务 器 只 能 访问 正在 存储 的 文件 ， 而 不 能 访 


中 存储 有 ~? 个 奇偶 校 验 码 。 

交付 阶段 就 像 所 有 文件 都 被 请 求 一 样 进行 。 当 仅 请 求 
部 分 文件 时 ， 该 方案 将 一 些 用 户 的 请 求 蔡 换 为 “未 请 求 的 文 
件 ” 并 继续 进行 , 如 同 请 求 所 有 文件 一 样 。 无 论 是 哪 种 请 求 ， 


问 其 他 服务 器 上 存储 的 文件 。 服 务 器 可 以 从 自己 的 文件 中 读 
取 多 个 段 ， 并 将 它们 组 合成 单个 消息 ， 但 是 存储 在 不 同 服务 
器 上 的 两 个 文件 不 能 组 合成 单个 消息 。 但 是 ， 假 定 服务 器 知 
道 每 个 用 户 缓存 的 内 容 以 及 存储 在 其 他 服务 器 中 的 内 容 ， 以 
便 他 们 能 够 协调 他 们 的 消息 Q0。 
本 文 使 用 子 索 引 来 表示 文件 索引 ， 超 级 索引 来 表示 段 索 
引 ， 所 以 将 表示 文件 互 中 的 第 j 个 段 。 本 文 也 使 用 不 同 的 
字母 来 表示 来 自 不 同 服务 器 的 文件 。 例 如 ， 4 表示 来 自 服务 
器 4 的 第 :个 文件 ， 隶 表示 来 自 文件 4 的 第 7 了 个 段 。 
1.2 Maddah 方案 
Maddah 在 文献 [6] 中 提出 的 编码 缓存 方案 有 一 台 服 务 器 
存储 所 有 文件 {A,,…,Fy} ， 用 户 通 过 共享 的 广播 链接 连接 到 
该 服务 器 。 其 目标 是 设计 缓存 和 交付 方案 ， 以 减少 链 路 的 高 


峰 负载 。 这 个 方案 将 每 个 文件 分 为 ”大 小 相等 的 非 


bp 
路 


每 个 文件 5 都 传输 (未 编码 或 编码) 消息 。 未 编码 的 消息 提供 
7 了 请求 的 用 户 没有 缓存 的 分 段 , 而 组 合 来 自 马 的 多 个 分 段 
的 编码 消息 用 于 消除 其 缓存 段 中 的 干扰 。 每 个 用 户 收集 
| >]w-p 个 有 用 的 消息 ， 这 些 消息 与 存储 在 其 缓存 中 的 
Ph 分量 一 起 用 来 恢复 C(B,P) MDS 人 码 中 的 所 有 ?分量 。 
因此 ， 从 服务 器 发 送 的 消息 总 数 是 N("， ] 。 在 这 种 干扰 
消除 方案 中 ， 可 以 实现 以 下 标准 化 (M. 书 表示 : 


(EN MED) 0 天 
K(K-TD 可 


~ 


(4) 


1.4 文件 条 带 化 

将 单 服务 器 编码 缓存 算法 扩展 到 多 服务 器 系统 的 最 简单 
方法 是 将 所 有 服务 器 上 的 每 个 文件 分 发 。 这 样 ， 每 个 用 户 将 
从 每 个 服务 器 请 求 相 同 数量 的 信息 ， 平 衡 负载 。 这 被 称 为 数 
据 条 带 化 02431， 在 数据 中 心 和 固态 驱动 器 中 是 常见 的 做 法 ， 


ey 


段 友 ，j=12..(，] 。 其 中 汪 伟 ， 并 且 将 每 个 片段 缓存 在 


可 以 并 行 写 入 或 读 取 多 个 驱动 器 或 存储 器 块 。 然 后 ， 用 户 将 


不 同 的 :个 用 户 组 中 。 在 交付 阶段 ， 服 务 器 向 :+1 个 用 户 的 每 


其 缓存 的 相等 部 分 分 配给 每 个 服务 器 ， 并 且 交 付 按 照 工 个 独 
立 的 单 服 务 器 需求 来 构建 。 本 文 现在 继续 详细 描述 条 带 如 何 


个 子 集 发 送 一 个 消息 , 总 共 为 | ,|] 个 消息 。 一 组 用 户 s 请 求 
文件 瑟瑟， 本 将 收 到 消息 ; 


m= OR ©.@ RY (1) 


其 中 : 六 是 除 请 求 环 的 用 户 之 外 的 所 有 用 户 缓存 的 段 的 索 
引 。 然 后 ， 每 个 用 户 可 以 将 其 缓存 中 己 有 的 段 加 密 以 恢复 所 
需 的 段 。 在 最 坏 的 情况 下 ， 即 当 所 有 的 用 户 请 求 不 同 的 文件 
时 ， 该 方案 产生 一 个 ( 按 文 件 大 小 标准 化 ) 峰 值 速 率 为 


天 /K 
Rn (1) 


1 
I+KM/N 
在 一 些 参数 组 合 下 ， 广 播 所 有 未 编码 的 缺失 段 可 能 要 求 
比 R(KD 更 低 的 速率 ， 所 以 广义 峰值 速率 是 : 
min{Re(K,D,N-M} ， 假 设 N、M 和 K 的 关系 满足 不 等 式 
ReCK.D<N-M ， 本 文 将 忽略 那些 病态 情况 。 研 究 表 明 ， 这 个 
峰值 速率 是 一 些 参数 组 合 所 能 达到 的 最 小 值 。 
1.3 干扰 消除 

对 Maddah 算法 的 仔细 研究 表明 ， 当 缓存 较 小 且 N<K 


T 


2) 
=K(1-M/N) 


降低 Maddah 方案 的 峰值 速率 ， 但 同样 的 想法 可 以 应 用 于 任 
何其 他 方案 。 
N 个 文件 {, 记 ,…,} 被 分 割 成 工 个 块 存储 在 不 同 的 服 


务 器 中 ， 每 个 块 被 分 成 |”] 段 。 这 些 段 


Rum 表示 ， 其 中 


;=12.…，N 代表 文件 编号 ，j=12.., (代表 段 号 ,m=12..1 


代表 块 号 。 在 第 m 个 服务 器 中 存储 每 个 文件 的 第 mm 个 片段 ， 
即 每 个 i 和 j 的 6”。 
这 个 配置 和 Maddah 的 方案 一 样 。 每 个 段 被 :个 用 户 组 


存 ， {EOD, FOD,..., FUD} 被 同一 个 用 户 缓存 。Maddah 方案 可 以 


被 分 成 工 个 分 量 : 


FH" OR" OB...@ PU 

m=1,2,.…L 由 不 同 的 服务 器 发 送 。 然后 将 这 个 问题 分 解 

成 个 独立 的 单 服务 器 子 问题 ， 减 少 文件 大 小 的 二 位 。 子 问 
题 具 有 与 全 局 问题 相同 数量 的 用 户 、 文 件 和 缓存 容量 。 


cc 
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如 果 有 一 个 额外 的 奇偶 校 验 服务 器 P 可 用 ， 它 将 为 每 个 
文件 存储 块 按 位 执行 XOR 运算 ， 即 对 于 所 有 的 ;和 7 均 有 
FW@RF0Y@…@ 0”。 然 后 ， 服 务 器 P 可 以 接管 一 些 传输 ， 
将 峰值 负载 降低 到 Maddah 方案 的 二 。 式 (5) 中 ,服务 器 P 可 


以 传输 所 有 组 件 的 XOR， 以 减轻 一 台数 据 服 务 器 的 传输 负 
担 。 如 果 有 两 个 附加 的 奇偶 校 验 服务 器 P 和 4 可 用 ， 则 有 可 
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Maddah 方案 的 优点 在 于 文件 段 以 简单 形式 存储 ， 而 不 是 作 
为 线性 组 合 编码 ， 因 此 它 需 要 更 大 的 缓存 容量 来 获得 编码 的 
缓存 增益 。 因 此 ， 当 缓存 容量 很 大 时 ，Maddah 的 方案 是 合 
适 的 。 
本 文 算法 的 放置 阶段 与 传统 方案 中 的 相同 。 例 如 ， 在 用 
户 数 K=6， 绥 存 容量 为 M =4 和 N=8 个 文件 的 系统 中 ， 每 个 
文件 被 分 成 20 个 段 , 每 个 段 由 +=3 个 用 户 存储 。 表 3 显示 了 


能 选择 L+2 个 服务 器 中 的 任何 来 处 理 式 (5) 中 的 每 组 消息 ， 
从 而 将 Maddah 方案 的 峰值 降低 到 二。 

对 于 干扰 消除 方案 ， 可 以 遵循 类 似 的 文件 分 发 的 处 理 过 
程 ， 实 现 相同 的 峰值 速率 缩放 比例 : 无 奇偶 校 验 时 为 了 ， 单 


奇偶 校 验 服务 器 为 下- ， 两 个 校 验 服务 器 为 二 。 
+1 L+2 
1.5 均衡 数据 放置 策略 
在 分 布 式 文件 系统 中 ， 当 客户 端的 请 求 流 相对 均衡 时 ， 
如 果 数 据 从 客户 端 到 存储 服务 器 端的 放置 也 是 均衡 的 ， 则 称 
整个 系统 的 数据 访问 相对 均衡 。 可 以 把 数据 均衡 放置 看 做 是 
一 类 映射 关系 ， 该 映射 能 够 使 存储 服务 器 和 客户 端 之 间 的 数 
据 访 问 保持 均衡 。 
通常 在 编码 存储 过 程 中 ， 以 stripe 作为 数据 的 最 小 单位 
来 存储 , 一 个 大 文件 被 分 割 为 多 个 stripe, 其 中 , 在 每 个 stripe 
中 有 7 个 数据 块 ， 且 前 m 个 数据 块 存储 的 是 原始 数据 ， 其 余 
nm 个 数据 块 存储 的 是 编码 数据 ， 可 以 把 这 些 数 据 块 当 作文 
件 存储 对 象 。 则 在 分 布 式 文件 系统 中 ， 对 象 文件 的 内 容 由 以 
下 部 分 组 成 : 大 文件 的 io 号 ; 每 个 stripe 的 stripe_id ; stripe 
内 数据 块 的 block_ia 。 比 如 说 , 有 个 100 GB 的 文件 , 其 ino 号 
为 2018， 在 每 个 stripe 中 有 8 个 数据 块 ， 原 始 数 据 块 和 编码 
数据 块 均 为 4 个 ,设置 数据 块 的 容量 大 小 block_size 为 64MB， 
则 通过 计算 可 知 ， 第 9001MB 数据 所 处 的 stripe_id 是 
9001/(64x4)=36 ， 有 是 其 所 处 的 stripe 的 block _id 是 
9001%(64x 人 D164=0 ， 此 时 它 所 处 的 对 象 文件 用 (2018,36,0) 三 元 
数组 来 确定 。 存 储 对 象 的 服务 器 节点 od_id 由 客户 端的 
client_id 和 求 得 的 三 元 数组 (ino,stripe_id,block_id) 来 确定 。 用 
osd_nodes_mm 表示 文件 系统 的 对 象 文件 节点 总 数 , 则 每 个 对 
象 文件 的 节点 osd _id 表示 为 : 
osd _id = funcO( funcl(ino, stripe _id,block _id) 
+client _id)%osd _nodes __num (6) 
其 中 : 映射 furc0:X 一 了 以 及 funcl:X 一 了 定义 为 vxeX:3lyeY 
vyeY:3dlxeX 。 
通过 建立 两 级 映射 可 以 使 文件 系统 在 存储 大 文件 时 ， 保 
证 整个 系统 数据 均衡 放置 ， 以 达到 减少 磁盘 争 用 的 目的 。 


2 方案 1 大 型 高 速 缓存 


本 章 将 Maddah 方案 扩展 到 多 服务 器 系统 ， 结 合 均衡 数 
据 放置 策略 ,将 每 个 文件 作为 一 个 单元 存储 在 数据 服务 器 中 ， 
如 表 1 所 示 。 


表 1 存储 在 每 个 服务 器 的 文件 


Table ] Files stored on each server 


服务 器 4 服务 器 B 服务 器 L 
A B 5 元 
A B, a EB 
A, B L 


Maddah 方案 高 度 依赖 于 缓存 容量 M。 与 干扰 消除 相 比 ， 


每 个 用 户 存 储 的 10 个 文件 片段 的 索引 ,假设 所 有 文件 都 是 相 
同 的 。 
考虑 到 存储 系统 的 峰值 速率 ， 本 文 假设 所 有 用 户 请 求 不 
同 的 文件 , 因此 每 个 用 户 可 以 用 它 所 请 求 的 文件 来 表示 。 用 5 
表示 为 用 户 集 合 , mi 表示 从 服务 器 4 发 送 给 5 中 所 有 用 户 的 
消息 ，Q={@,%,…,4} 表示 文件 索引 的 向 量 ，Y={7X,h,…,%} 表 
示 分 段 索 引 的 向 量 ， 4 ={4w,442,…,hw} 表示 请 求 或 用 户 ， 


汉 ={4 人 8@42@…8@43} 表示 消息 ， 其 中 ， 4 代表 服务 器 4 中 
第 i 个 文件 的 第 j 个 分 割 ， 义 @ 及 代表 消息 : 
MOB =(AMOBI)D(AMI BB)D...0(M DB) 


2.1 没有 校 验 服务 器 

在 无 宛 余 的 系统 中 ， 服 务 器 之 间 不 能 协同 工作 。 在 交付 
阶段 ， 每 个 用 户 被 分 配 到 存储 它 请 求 的 文件 的 服务 器 ， 然 后 
每 个 数据 服务 器 发 送 消息 来 完成 它 的 请 求 。 它 遵循 Maddah 
的 方案 ， 接 收 谓 个 请 求 的 服务 器 将 需要 传输 [, -人 个 


t+l 1 十 1 
消息 。 因 此 ， 该 服务 器 的 归 一 化 的 峰值 速率 将 可 以 表示 为 
(全 们 [全 ， 当 所 有 用 户 请 求 来 自 同一 个 服务 器 的 广 


1 十 1 1 十 1 
件 ， 即 m=K 时 ， 最 坏 的 情况 发 生 ， 此 时 峰值 传输 速率 与 单 
个 服务 器 系统 相同 。 
2.2 一 个 奇偶 校 验 和 两 个 数据 服务 器 
本 节 介 绍 一 个 非常 简单 的 存储 系统 ， 它 包含 两 台数 据 服 
务 器 和 一 台 存 储 上 述 两 个 数据 按 位 XOR 运算 的 第 三 台 服 务 
器 ， 如 表 2 所 示 。 尽 管 每 个 服务 器 只 能 访问 自己 的 文件 ， 但 
表 2 中 的 配置 允许 通过 合并 来 自任 何 两 个 服务 器 的 消息 来 编 
写 消 息 。 即 如 果 服 务 器 A( 或 B) 在 另 一 个 服务 器 之 前 完成 其 
传输 任务 ， 则 它 可 以 与 奇偶 校 验 服务 器 一 起 工作 以 帮助 服务 
器 B( 或 A)。 这 种 协作 方案 允许 同时 处理 存储 在 同一 服务 器 
上 的 两 个 文件 请 求 ， 平 衡 负 载 并 将 最 差 情况 下 的 峰值 速率 降 
低 到 小 于 没有 奇偶 校 验 服 务 器 时 所 达到 的 峰值 速率 。 
表 2 存储 在 每 个 服务 器 的 文件 


Table 2 Files stored on each server 


服务 器 4 服务 器 如 服务 器 P 
4 B A@B 
A 及 水 四 及 
4 4@8 
还 有 一 个 更 好 的 传输 方案 ， 将 来 自 三 台 服 务 器 的 消息 组 
合 在 一 起 ， 以 便 向 用 户 获 取 更 多 信息 。 其 基本 思想 是 在 数据 
服务 器 的 每 个 消息 中 包含 一 些 未 被 请 求 的 段 以 及 请 求 的 段 。 


如 果 附 加 分 段 选 择 得 当 ， 则 可 以 将 它们 与 来 自 奇 偶 校 验 服务 
器 的 消息 组 合 以 获得 所 需 的 文件 分 段 。 本 节 提 出 的 算法 就 是 
基于 这 个 思想 。 

就 像 在 Maddah 的 方案 中 一 样 ， 数 据 服务 器 把 每 个 消息 
发 送 给 1+1 个 用 户 , 该 消息 包含 t+1 个 分 段 。 如 果 用 户 请 求 发 
件 人 存储 的 文件 ， 则 该 消息 将 包含 相应 的 段 ， 否 则 消息 将 包 
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插 它 在 服务 器 P 中 的 奇偶 性 的 补 码 , 即 4 ， 反 之 亦 然 。 因 此， 要 ER 
来 自 服务 器 A 或 B 的 每 个 消息 的 内 容 由 发 送 者 和 接收 者 集合 。 劣 吕 的 请 求 .服务 器 P 向 B 中 的 所 有 用 户 发 送 m'= 久 8 厂 ， 


确定 ， 分 别 用 8 或 史 表 示 。 在 表 3 所 示 的 例子 中 ， 从 服务 器 。 使 得 5 和 5, 中 的 所 有 用 户 都 获得 与 Maddah 方案 中 相同 的 分 
A 到 3={4,4,4,B ， 对 应 于 用 户 1 到 4 的 消息 将 是 段 。 
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m=A@ADAOA., 证 明 当 < 为 空 (8 可 以 是 空 的 或 非 空 的 ) 时 , 这 是 引 理 1 
表 3 文件 段 到 用 户 缓存 的 映射 的 一 个 特例 。 
Table3 File segment mapping to user cache 定理 1 如 果 用 户 子 集 5 和 5; 满足 引 理 1 中 的 条 件 ， 本 
文件 段 /用 户 1 2 3 4 5 6 文 称 (51,5,) 是 一 个 有 效 的 对 。 
1 x X X 本 文 的 目标 是 设计 一 个 方案 ， 它 能 够 最 小 化 任何 服务 器 
2 XxX X X 发 送 的 最 大 消息 数量 。 如 果 两 个 用 户 子 集 形 成 一 个 有 效 的 对 ， 
3 X XXX 区 则 可 以 用 每 个 服务 器 的 单个 传输 来 替换 Maddah 方案 中 相应 
4 xX X Xx 的 消息 。 因 此 ， 本 文 希望 尽 可 能 多 地 作出 有 效 的 配对 。 
5 Xx X X 引 理 2 表 2 中 服务 器 系统 的 峰值 速率 为 
(3+34)jR(KwD ， 其 中 表示 未 配对 消息 的 比率 ， 并 上 且 
4 X X X 
8 x X X t=KMI/N 。 
9 x X X 证 明 ”对 于 每 个 有 效 的 配对 ， 本 文 可 以 使 用 来 自 每 个 服 
10 xX XxX XX 务 器 的 单个 传输 来 提供 与 在 Maddah 的 单 服务 器 方案 中 的 两 
11 SN 个 传输 相同 的 信息 ， 速 率 为 24-A)Re(K,) 。 未 配对 的 消息 按 
12 XxX X X 2 
13 X X x 照 上 文 的 描述 进行 传输 ， 即 从 三 台 服 务 器 中 的 任何 两 台 服 务 
14 X X X 器 合并 消息 。 假 设 这 三 个 服务 器 之 间 的 负载 是 平衡 的 ， 则 速 
pe ”  。 率 变 为 是 2R(K,D) 。 
16 X Xx Xx 3 
17 xX X X 下 面 的 引 理 描述 了 在 对 称 请 求 的 情况 下 (两 个 服务 器 接 
18 X X X 收 到 相同 数量 的 请 求 ) 不 成 对 的 用 户 子 集 ^ 的 比率 。 
19 X X XX 引 理 3 ”如果 请 求 是 对 称 的 ， 则 当 : 是 偶数 时 A=0， 当 + 
20 xX X X 是 奇数 时 As1。 也 就 是 说 ， 在 对 称 请 求 的 情况 下 ， 可 以 达到 
请 求 A hh 4 BB BB BB, 以 下 的 峰值 速率 : 
引 理 1 令 服 务 器 A 和 B 的 接收 者 分 别 是 5,={4,Bp,4} RCK,n), 侦 数 
R(K,) = 1 (7) 
和 5,={4,By,B8.} ， 其 中 ，a 和 有 表示 显示 的 集合 ，* 代表 任 (je 仙 


其 中 : Re(K,?) 在 式 (2) 中 已 经 定义 。 

在 表 3 中 ， 每 个 分 段 被 1= 全 -3 个 用 户 缓存 ， 配 对 算法 
喀 -到 @ 成 @ 记 。 选择 分 段 索引 ， 以 便 每 个 用 户 可 以 取消 除 。 时 未 沽 化 磅 秆 惠 汶 25， 明显 代 于 Maddah 单 服务 路 方案 的 
了 其 中 一 个 组 件 之 外 的 所 有 组 件 。 这 为 用 户 5 和 4 分 别提 ”3/4。 
供 了 一 些 未 被 请 求 的 段 4 各 然后 服务 器 P 可 以 发 送 消息 。 2.3 一 个 奇偶 校 验 和 上 个 数据 服务 器 

前 面 讨 论 了 两 个 数据 服务 器 和 一 个 奇偶 校 验 服务 器 的 情 
况 ,相同 的 算法 可 以 扩展 到 具有 两 个 以 上 数据 服务 器 的 系统 。 
户 获得 缺失 的 分 段 。 这 三 个 传输 等 同 于 等 式 (0 中 定义 的 消息 。 如 果 有 个 数据 服务 器 和 一 个 奇偶 校 验 服务 器 ， 则 可 以 通过 
ms 利 ms 。 合并 来 自 工 个 服务 器 的 消息 来 建立 消息 。 假 设 

证 明  s 和 中 中 的 所 有 用 户 至 少 从 存储 其 请 求 的 文件 es 
的 服务 器 获得 一 个 期 望 的 段 。 那些 在 ,m5, 也 收 到 来 自 服务 。 “人 站， 加 "如 7 为 两 个 用 户 子 集 ， 其 中 和 
器 A 或 未 请 求 的 段 B。 仅 证 明 $m5; 中 的 用 户 可 以 使 用 这 个 。 六 为 服务 器 C 通过 和 * 表 示 的 任意 索引 集合 ,并 且 5, 和 
未 请 求 的 段 从 mrs 获得 它 的 补 码 。 可 以 配对 ， 这 样 服务 器 A，B 和 P 需要 一 次 传输 来 提供 与 

不 失 一 般 性 ， 考 虑 用 户 B4 eS,m5s, 。 选 择 巾 中 的 一 组 分 。 Maddah 单 服务 器 方案 中 的 消息 ms 和 ms 相同 的 信息 。 其 他 
段 索引 ， 以 便 用 户 5 缓存 除 第 ; 个 以 外 的 所 有 分 段 。 同样 地 ， ”数据 服务 器 C 到 工 需 要 最 多 两 次 传输 ， 如 图 1 中 的 成 对 传输 
从 局 中 选择 指数 7 使 得 84 可 以 缓存 所 有 文件 。 因此 ，Bs 可 ”所 示 , A、B、C 和 了 D 是 数据 服务 器 , P 代表 奇偶 校 验 服务 器 。 


家 


是 合 ， 且 $1,#5, 。 相 应 的 信息 表示 为 岂 = 尿 @ 必 @ 伙 和 


2 =(42@ 肛 )8(45@Bb) 到 Sm ， 使 得 5, 和 ;中 的 每 个 用 


rd 
以 从 慌 中 获得 名 。 将 这 两 者 结合 得 到 期 望 的 段 成 。 只 要 ee 
5 x 5 ， 该 分 段 将 不 同 于 By 从 由 获得 的 分 段 ， 因 为 分 段 索 a) 服务 器 C 发 送 两 个 消息 到 8 和 5;。 例如， 服务 器 C 想 
引 与 用 户 子 集 之 间 存在 一 对 一 的 关系 。 要 发 送 动 和 nw ， 向 相应 的 资源 用 户 发 送 请 求 信息 。 

b) 服务 器 A 发 送 咪 ， 向 请 求 {4.,4} 的 用 户 提供 所 需 的 


推论 1 假设 5={4,Bs} 并且 5,={8.} ， 即 它 只 包含 对 服 


段 ， 并 向 请 求 B 的 用 户 提供 相应 的 不 需要 的 A 段 。 
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c) 服务 器 B 发 送 m8 ， 向 请 求 {8,,3.} 的 用 户 提供 所 需 的 
段 ， 并 向 请 求生 的 用 户 提供 相应 的 不 需要 的 B 段 。 
d) 服务 器 P 向 请 求 的 用 户 发 送 mi*”。 使 用 之 前 接收 到 


的 不 需要 的 段 ，{%.s 中 的 用 户 可 以 求解 所 需 的 A 段 和 B 段 。 
对 所 请 求 和 接收 的 段 进 行 简单 的 比较 表明 ， 这 些 传输 在 
Maddah 的 单 服务 器 方案 中 传递 与 消息 ws 和 ms 相同 的 信息 。 


A||B 6 5 | |e 


xX xX Xx 
配对 传输 : ’ 
X Xx X 
X X X X 
不 配对 传输 : < 
Xx X xX Xx 


图 1 配对 4 个 数据 服务 器 和 一 个 奇偶 校 验 服 务 器 系统 
Fig. 1 Matches four data servers with a parity server System 
定理 2 ”具有 Z>3 个 数据 服务 器 和 一 个 奇偶 校 验 服务 器 
的 系统 可 以 达到 以 下 标准 化 峰值 速率 : 


Re(KD= SRK) (8) 


证 明 在 Maddah 方案 中 ， 可 以 从 服务 器 A、B 和 了 中 


si. 2{ Kk wb ee a ee | 
发 送 3[ 人] 个 消息 ， 这 些 消息 可 以 按照 如 下 方式 发 送 完成 : 


1 十 1 
按照 它们 所 具有 的 段 的 数量 对 消息 进行 分 组 ， 在 每 个 组 内 进 
行 消息 配对 ， 每 组 中 至 少 有 了 > 了 个 消息 可 以 配对 。 没 有 A 
或 B 分 段 的 消息 不 需要 从 服务 器 A、B 或 P 进行 任何 传输 。 
剩余 的 所 < ,个 消息 可 以 通过 服务 器 c 传输 。 


1 十 1 
2.4 两 个 奇偶 校 验 和 上 个 数据 服务 器 
本 节 把 算法 扩展 到 具有 工 数据 和 两 个 线性 奇偶 校 验 服 务 
器 的 系统 。 奇 偶 校 验 服 务 器 通过 行 来 存储 文件 的 不 同 线性 组 
合 ， 如 表 4 所 示 。 假 定 服务 器 形成 MDS 码 。 本 文 交付 策略 
表明 ， 峰 值 速度 可 以 降低 到 Maddah 单 服务 器 方案 的 一 半 。 
表 4 在 RAID-6 校 验 服务 器 中 存储 的 文件 
Table4 Files stored in RAID-6 Check Server 


2 
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的 段 可 以 稍 后 使 用 服务 器 P 中 的 奇偶 校 验 来 解码 。 
(b)Y 中 的 剩余 用 户 将 在 可 能 的 情况 下 获得 与 5, 相应 的 
期 望 段 ， 和 否则 将 得 到 与 9 相对 应 的 不 需要 的 段 。 
换 名 话说， 每 个 服务 器 C,D… 民 将 发 送 对 应 于 8 的 片段 
给 请 求 其 文件 的 用 户 或 来 自 服务 器 B 的 片段 。 此 时 ， 所 有 用 
户 都 满足 了 与 % 相关 的 请 求 , 而 从 服务 器 B 请 求 文件 的 用 户 
满足 了 与 史 相 关 的 请 求 。 每 个 用 户 也 收 到 了 L-2 个 不 需要 
的 “匹配 ”的 片段 。 
d) 奇偶 校 验 服务 器 P 和 Q 使 用 每 个 用 户 的 段 的 组 合 向 
SimS,={7} 发 送 消息 。 那 些 从 服务 器 B 请 求 的 文件 将 得 到 两 
个 对 应 于 5, 的 段 的 组 合 ， 其 余 的 将 得 到 对 应 于 5; 的 段 的 组 
合 。 由 于 每 个 用 户 现在 都 有 Z-2 个 独立 的 段 和 所 有 工段 的 
两 个 独立 的 线性 组 合 ， 它 可 以 隔离 所 请 求 的 段 。 
对 所 请 求 和 接收 的 段 进 行 比较 可 知 ， 这 种 传输 方式 具有 
和 Maddah 单 服务 器 方案 相同 的 消息 ms 和 ms: 。 


定理 3 ”对 于 工 个 数据 服务 器 和 两 个 奇偶 校 验 服 务 器 系 
统 ， 可 以 实现 以 下 归 一 化 峰值 速率 : 


其 中 : A< 上 是 配对 损失 ， Re 是 等 式 (2) 中 单 服务 器 Maddah 方 
案 的 比率 。 

证 明 “按照 它们 从 服务 器 A 或 B 所 具有 的 段 的 数量 对 消 
息 进 行 分 组 。 在 每 个 组 内 将 消息 配对 。 对 于 不 包含 来 自 A 或 
B 的 段 的 消息 ， 本 文 重复 与 其 他 两 个 服务 器 相同 的 过 程 ， 得 
到 相同 的 结果 : 最 多 只 有 1/3 个 未 配对 。 

如 上 文 所 示 ， 每 对 消息 可 以 使 用 来 自 每 个 服务 器 的 单个 
传输 来 传递 ， 因 此 配对 消息 速率 为 了 (1-A)R(K,) ， 其 中 人 表 
示 未 配对 消息 的 比例 。 在 所 有 服务 器 之 间 平 衡 负载 ， 它 们 的 


y 
率 为 -一 ARCK.D 。 
速率 7ARc(RD 


3 方案 2 小 型 缓存 

将 1.3 节 中 的 干扰 消除 方案 扩展 到 多 服务 器 系统 ， 结 合 
均衡 数据 放置 策略 ， 提 出 缓存 的 线性 组 合 。 干 扰 消除 方案 专 
门 设计 用 于 在 高 速 缓存 大 小 较 小 时 降低 峰值 速率 。 表 1 表明 ， 


服务 器 了 服务 器 Q 
A+B+...+L A+ksB +...+k.L 
b+B,+...+D A +ksB,+...+kiL, 
A+B,+...+L, A +ksB,+...+kL, 

引 理 4 设 5.={4.,7} ，5,={B.,Y}， 其 中 Y 代表 来 自任 何 


服务 器 的 一 组 公共 请 求 。% 和 5, 可 以 配对 ， 以 便 每 个 服务 器 
的 单个 传输 填充 相同 的 请 求 作 为 式 (1) 中 的 消息 ms 和 ms 。 

证 明 ”传输 方案 与 第 2.2 小 节 中 的 算法 有 相同 的 配对 思 
路 。 传 输 过 程 如 下 : 

a) 服务 器 A 发 送 mx ， 向 请 求 其 文件 的 
段 ， 并 向 其 他 用 户 提供 相应 的 非 期 望 的 A 段 。 

b) 服务 器 B 发 送 m3 ， 向 请 求 其 文件 的 
需要 的 B 段 提供 所 需 段 。 
c) 服 务 器 C,D… 江 每 个 用 户 向 Sm92 = 人 发 送 单个 消息 ， 
每 个 用 户 具 有 以 下 内 容 : 
(a) 从 服务 器 B 请 求 文件 的 用 户 从 服务 器 A 收 到 一 些 不 需 
要 的 段 。 服 务 器 C,DP… 江 向 它们 发 送 匹 配 的 数据 ， 以 便 期 户 


户 提供 期 望 的 


户 和 对 应 的 不 


传输 速率 随 着 服务 器 数量 了 的 减少 而 减少 。 对 奇偶 校 验 服务 


器 的 情况 进行 类 似 的 分 析 ， 这 可 以 解释 为 用 户 缓存 的 扩展 。 
定理 4 在 具有 L 个 数据 服务 器 和 并 行 信道 的 系统 中 ， 


干扰 消除 方案 的 重 值 速 率 可 以 降低 到 单 服务 器 系统 中 的 ， 


即 可 以 实现 以 下 WM,R) 对 : 
人 
K(K-)1) K 
无 论 每 个 文件 是 跨 服 务 器 (分 条 ) 还 是 作为 单个 块 存储 在 
一 台 服 务 嚣 中， 都 是 如 此 。 
证 明 与 单个 服务 器 系统 相 比 ，L 个 服务 器 上 的 文件 条 


带 化 将 干扰 消除 方案 的 峰值 速率 降低 了 了 


与 Maddah 的 方案 相 比 ， 干 扰 消 除 方案 从 每 个 文件 发 送 
相同 数量 的 段 ， 而 不 管用 户 的 请 求 。 此 外 ， 每 个 消息 由 一 个 
文件 组 成 的 段 组 成 。 因 此 ， 即 使 不 同 的 文件 存储 在 不 同 的 服 


务 器 中 ， 也 可 以 传输 相同 的 消息 。 每 个 服务 器 将 需要 传输 


1=0,1,...,K (10) 


1 
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缓存 的 扩展 来 进一步 降低 传输 速率 。 第 1.3 节 解 释 了 在 干扰 
消除 算法 中 ， 每 个 用 户 缓存 由 系统 MDS 码 CQQ,P) 编码 一 组 


六 | 


为 它 将 存储 相同 比例 的 文件 。 然 后 峰值 负 


如 果 有 奇偶 校 验 服务 器 ， 本 文 可 以 通过 将 它们 作为 用 户 


分 段 产 生 的 奇偶 校 验 符号 。 可 以 按照 这 样 的 方式 选择 代码 ， 


恨 


Q 中 的 信息 的 组 合 来 找到 。 


1 可 以 将 这 些 奇偶 校 验 符号 中 的 一 些 作 为 存储 在 服务 器 P 了 和 


例如 ， 奇 偶 校 验 服 务 器 P 存储 文件 的 水 平和 ， 所 以 它 可 


天 一 | 


上 传 送 以 下 格式 的 消息 ; 晤 呈 cs 可， yz) 。 对 于 任何 


用 户 集 
线性 组 


合 5 有 共有 任意 系数 为 。 这 对 应 于 方程 (3) 中 所 有 分 段 的 
合 。 类 似 地 ,奇偶 校 验 服务 器 Q 可 以 传输 一 些 线 段 的 


其 他 线性 组 合 ， 也 可 以 作为 MDS 码 的 组 成 部 分 。 这 有 效 地 


增加 了 M' 个 文件 单元 的 高 速 缓冲 存储 器 的 大 小 , 对 应 于 奇偶 


校 验 服 务 器 在 传送 阶段 能 够 发 送 给 每 个 用 户 的 信息 量 。 


区 


峰值 速率 的 限 


定理 5 如 果 有 7 个 奇偶 校 验 服务 器 且 K>N ， 则 对 于 
=0,4...,K ， 可 以 得 到 以 下 (M,R) 对 : 
tN-1+KEN NOK-D NOK-D 
( KK-D ' LK: ’ LK | (1D) 
证 明 奇偶 校 验 服务 器 发 送 的 信息 受到 数据 服务 器 的 


出 ， 即 根据 等 式 (10) 的 生生 下。 假设 最 坏 的 情 


一 中 


况 , 从 奇偶 校 验 服务 器 的 每 个 传输 将 有 益 于 单个 用 户 。 因 此 ， 


ee am 0) NK= ys 
每 个 奇偶 校 验 服务 器 可 以 通过 M'= ”52 有 效 地 增加 每 个 


用 户 的 缓存 。 


和 


这 种 内 存 共享 策略 在 缓存 容量 很 小 时 提供 了 显著 的 改 


进 。 图 2 显示 了 存储 在 L=4 个 数据 服务 器 中 的 KX=15 个 用 户 


上 N=12 个 文件 的 性 能 。 当 缓存 容量 MK 较 小 时 ， 带 有 两 个 奇 


人 


校 验 服务 器 的 系统 的 峰值 速率 R 远 远 低 于 没有 奇偶 校 验 服 


务 器 的 情况 。 随 着 缓存 的 增长 ， 使 用 奇偶 校 验 服务 器 的 系统 


的 优势 变 得 越 来 越 小 。 
3 l 
全 没有 校 验 服务 器 
2.8. 和 * 2 个 校 验 服务 器 
vy . 
许 2.6 
并 
加 +4 
2.2. 
2 上- 2 r 上 
0 02 04 06 08 1 
缓存 容量 M 


图 2 没有 奇偶 校 验 服务 器 和 使 用 两 个 奇偶 校 验 服务 器 的 性 能 


Fig.2 Shows no parity server and performance using two parity 


servers 


干扰 消除 方案 是 针对 单 服务 器 系统 中 文件 数 少 于 用 户 


CNsK ) 的 情况 而 设计 的 。 但 是 ， 由 于 在 多 服务 器 系统 中 ， 峰 
值 负载 减少 了 了 ， 所 以 当 L>N 时 ， 如 果 N>K， 干 扰 消 除 方 
案 也 可 能 具有 良好 的 性 能 。 为 了 应 用 该 算法 ， 本 文 可 以 只 添 
加 Nk 个 具有 任意 请 求 的 虚拟 用 户 。 那 么 ， 本 文 有 以 下 结 


论 : 如 果 有 7 个 奇偶 校 验 服 务 器 且 K<N ， 则 可 以 实现 以 下 
(M,R) 对 : 
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小 部 分 的 消息 ， 


荷 可 以 减少 到 式 (0) 中 的 工 。 


(S$-7o WD -0 N (12) 


N TR es 


4 ”仿真 实验 与 分 析 


通过 基于 Linux 的 NS2 仿真 软件 对 提出 的 两 种 方案 进行 
仿真 实验 ， 共 设置 了 两 组 实验 ， 两 组 实验 均 在 一 个 奇偶 校 验 
服务 器 系统 和 两 个 奇偶 校 验 服务 器 系统 中 进行 ， 并 将 提出 的 
方案 1、 方案 2 与 Maddah 方案 条 带 化 外 、 干 扰 消 除 条 带 化 外 
进行 比较 ， 接 下 来 简单 介绍 实验 参数 设置 。 

4.1 实验 参数 设置 
两 组 实验 分 别 设置 不 同 的 N 和 KK 值 ， 第 1 组 设置 为 
N=20 ，K=15 ， 第 2 组 设置 为 N=20，K=60。 

对 于 一 个 系统 ，N=20 个 文件 存储 在 L=4 个 数据 服务 器 
中 ， 每 个 服务 器 有 5 个 文件 ， 用 户 组 :+ 设置 为 5, 方案 1 和 2 
的 参数 计算 式 分 别 如 表 5、6 所 示 ， 可 根据 不 同 的 N、K、 
值 值 计算 得 到 相应 的 服务 器 参数 值 。 

表 5 方案 1 的 归 一 化 峰值 速率 


Table 5 Normalized peak rate of scheme 1 


服务 器 系统 归 一 化 峰值 速率 
单个 服务 器 RD-( K | 
t+1 1 
个 数据 ， 一 个 奇偶 校 验 RK 


大 二 ， 1 1 
L 个 数据 ， 两 个 奇偶 校 验 (3+ 直 jxn( as) 


表 6 方案 2 的 归 一 化 (M,R) 对 
Table6 Normalized (M,R) pairs of scheme 2 


服务 器 系统 归 一 化 (WM. 对 
, 1N_Iy+K_N NK-) 
单个 服务 器 人 


工 个 数据 ，7 个 奇偶 校 验 >- N(K -1) 2 


K(K-1) ZK2 ” LK 


2 _ (VN-D (N- 
Z 个 数据 ，7 个 奇偶 校 验 ($7 D) 2] 


N IN’L 
4.2 实验 结果 和 分 析 

图 3 和 4 分 别 显示 了 一 个 和 两 个 奇偶 校 验 服务 器 的 情况 。 
假设 有 KE=15 个 用 户 ， N=20 个 文件 。 由 图 可 知 ， 条 带 化 提供 
了 更 低 的 峰值 速率 。 另 外 ， 由 于 N>K ， 在 使 用 条 带 化 时 ， 
干扰 消除 方案 总 是 比 Maddah 方案 具有 更 差 的 性 能 。 在 没有 
条 带 化 的 情况 下 ， 当 缓存 容量 较 小 时 ， 方 案 2 的 峰值 速率 比 
方案 1 更 低 。 


Maddah 方 案 条 带 化 
一 干扰 消除 条 带 化 

= 方案 1 

> 方案 2 


0 5 10 15 20 
图 3 N=20 ，K=15 时 , 一 个 奇偶 校 验 服务 器 系统 中 四 种 方案 的 性 能 
Fig.3 N=20,K=15 .Performance of four schemes in a parity-check 


server system 
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图 4 N=20， 


K=15 时 ， 在 两 个 奇偶 校 验 服务 器 系统 中 
四 种 方案 的 性 能 


Fig.4 N=20,K=15 . Performance of four schemes in 


two parity-check server systems 


图 5 和 6 分 别 比较 了 一 个 或 两 个 奇偶 校 验 情况 下 用 


户 数 


为 K=60 时 方案 1 和 方案 2 的 性 能 。 同 样 的 ， 条 带 化 提 
更 低 的 峰值 速率 ， 且 当 缓 存 容量 很 小 时 ， 条 带 化 干扰 消 
条 带 化 Maddah 方案 有 更 好 的 性 和 
当 缓 存 容 量 较 小 时 ， 方 案 2 提供 较 低 的 峰值 速率 ， 而 当 
容量 增加 时 , 方案 1 具有 较 好 的 性 能 。 而 且 ， 曲 线 在 M 
又 点 比 在 图 3 和 4 中 的 点 更 大 ， 这 意味 着 当 用 户 数量 多 
件数 更 倾向 于 使 用 方案 2 来 进行 缓存 。 


H 


Maddah 方 案 条 带 化 | 
9 一 干扰 消除 条 带 化 

0 ， 二 方案 1 

一 方案 2 


缓存 容量 M 
天 =60 时 ， 一 个 奇偶 校 验 服务 器 系统 中 
四 种 方案 的 性 能 
Fig. 5 N=20， 天 =60. Performance of four schemes 


图 5 N=20， 


in a parity server system 


10F = 
Maddah 方 案 条 带 化 
8 “干扰 消除 条 带 化 
| 一 方案 1 
一 方案 2 


全 5 10 15 20 
绥 存 容量 M 
图 6 N=20，K=60 时 ， 两 个 奇偶 校 验 服务 器 系统 中 


四 种 方案 的 性 能 


Fig. 6 Performance of four schemes 


in two parity-check server Systems 


能 。 对 于 方案 1 和 方案 2， 


供 了 
除 比 


缓存 
的 交 


于 文 


比例 地 减少 . 当 每 个 文件 作为 单个 块 存储 在 一 个 服务 器 中 时 
算法 根据 高 速 缓存 存储 器 的 大 小 提供 了 不 同 的 高 速 缓存 和 交 
付 方案 。 本 文 提出 的 编码 缓存 方案 能 够 以 创造 性 的 方式 利用 
这 种 元 余 来 降低 可 达到 的 流量 峰值 速率 。 
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Maddah 方 案 条 带 化 
= 干扰 消除 条 带 化 本 文 提出 一 种 用 于 降低 具有 分 布 式 存储 和 不 同 匈 余 级 别 
Aor 方案 1 的 多 服务 器 系统 中 的 峰值 数据 速率 的 编码 缓存 方案 ， 通 过 在 
峰 方案 2 多 个 服务 器 上 分 割 每 个 文件 ， 峰 值 速率 可 以 与 服务 器 数量 


下 一 步 的 工作 是 设 


计 具 有 不 同文 件 保护 级 别 的 擦 除 码 0445， 以 便 将 本 文 方案 扒 
广 到 具有 不 同 普及 性 的 文件 系统 中 。 
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